文本数据相关论文
在当今大数据时代的环境背景下,规模庞大的互联网数据信息无法得到有效的利用,“信息过载”日益加重。使用推荐系统可以有效地为用......
五年发展规划(The Five-Year Plan),也称五年发展计划,即中华人民共和国国民经济发展五年规划纲要,重点目标是对我国的主要经济社会......
财务报告舞弊是企业舞弊的手段之一,不仅会导致会计信息失真,而且会危害经济的健康发展,因此,如何克服传统的人工检测和基于数值指......
基于文本数据的混频预测模型是本文提出的新模型,是指模型中存在非结构化文本数据时,自变量之间时间统计频率一致(同频)或者时间统计......
从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键.针对目前主流的远程监督关系抽取方法常常忽略实体对的类......
大数据时代产生了大量的文本数据,由于数据源的不同以及产生数据过程的复杂性,造成了大量的数据具有异质结构.将几种最新的机器学......
安全永远是轨道交通运输的重要主题。轨道交通通常是指国家铁路系统、城际轨道交通和城市轨道交通。保证轨道交通运输安全需要工作......
伴随信息社会的迅猛发展,大量数据不断地产生出来.这其中,有相当一部分是由电信网络以及社交网络产生的文本数据,如短信、彩信、微......
舆情是指一定时期内一定范围内的社会群体对某些社会想象和现实的主观反映,实时地计算舆情能够及时掌握真情动态、积极引导社会舆......
设计高效搜索算法往往需要使用hash链表,常数级的查找速度是任何别的算法都无法比拟的。根据海量NAT日志的文本结构特点,将hash链表......
本文对文本语义挖掘的本体论模型进行了研究。Internet的出现,将人类带入了信息化时代。信息化时代的最大特点是信息的交流方式发生......
我国的传统村落保护与发展研究主要基于以现场踏勘为基础的传统数据。近年来,伴随着网络技术、无人机航拍等技术的快速发展,大数据......
人工智能技术近年来迅猛发展,可以轻松提取出自然数据中的特征和内在联系,非常擅长拟合高度非线性关系。因此,人工智能技术被广泛地应......
已有证据表明传统的均值-方差投资组合策略在样本外评价中并不稳健,甚至其绩效还不如经典的等权重策略,这为投资组合优化带来了不小......
互联网的发展和移动客户端的普及拓宽了投资者获取信息的渠道,影响了股票市场的运行模式。行为经济学的研究让人们意识到投资者情绪......
在大数据、自然语言处理、数据挖掘等技术迅速发展的今天,如何有效地从互联网平台上积累的大量与财经领域相关的财经文本数据中,挖掘......
研究BIM集成应用下的车站客流消防应急疏散仿真,有效仿真车站客流消防应急疏散过程。利用BIM技术构建车站客流消防应急疏散BIM模型......
对开源环境下的本地数字资源系统进行框架和流程设计,在此基础上详细分析相关开源技术和服务实现。设计本地数字资源的统一处理模......
随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价......
文本研究是日本古典文学研究中最基础的部分。《源氏物语》的抄本被池田亀鑑分成“青表纸本”“河内本”及“别本”三大类,“大岛......
近些年来,我们所研制的一些真正实用的汉字情报检索系统和图书馆自动化系统中的书目检索系统,很少有突出体现汉字的性质与特点的......
一、ISBD(CF)的修订过程ISBD(CF)即国际标准书目著录计算机文档,出版于1990年。它采用国际上通用的《英美编目条例》2版修订本(AACR2R)的规则,合并了其中的一些条款......
该文论述了数字图书馆的基本概念 ,分析了数字图书馆的特点 ;在此基础上给出了数字图书馆的基本功能结构。最后讨论了数字图书馆面......
从整体上介绍了全文检索技术,并对其中的几个关键技术进行改进,以使其能够更好地应用在数字图书馆建设中。
Introduced the whole......
分析和研究由EPO(European Patent Office,欧洲专利局)提供的EPODOC(欧洲专利局专利文献数据)、TXTWO(国际专利全文文本数据)和TXT......
【目的】提出不依靠专利引文数据、利用专利文本数据评价企业技术实力的方法。【方法】该方法综合采用专利授权数量指标、专利增长......
总论AELISE 3740-59-15(5)农民数字化贫困自我归因分析及启示——来自皖甘津的田野调查/闫慧,闫希敏(南开大学商学院信息资源管理......
随着“互联网+”理念的推动以及大数据时代的到来,网络信息技术的发展与现代游客旅游活动的关系越发密切,网络游记已成为旅游者感......
大数据环境导致数据密集型科研范式产生,知识服务机构的服务模式也已转变为以用户为中心。在这种情况下,知识资源存在动态复杂的关......
采用本体与文本文挖掘相结合的方法,提出了基于领域本体的文本挖掘模型。首先创建本体结构,引入本体的“概念-概念”相关度矩阵,利......
在建设了藏语编码平台以后,藏语信息处理需要做的就是在研究领域以及范式方面的转型。本文首先对藏语文本信息处理的发展情况进行......
1.您觉得哪些计算机技术与语料库语言学研究密切相关?计算机技术可以分为3个层面来看待,分别是(1)工具;(2)方法;(3)思想。不同层面......
每一次传播技术的革新,都会带来社会深层的变革。从个人层面来说,传播技术会改变人的兴趣结构,改变人们的思维方式,甚至改变社区的......
文本挖掘技术是指从文本数据中抽取有价值的信息和知识的计算机处理技术。其在中医药研究中主要应用于探求药物使用规律,证药相......
深度学习作为新兴的机器学习研究领域,迄今已在语音识别、图像理解和视频识别等应用领域取得了突破性的进展。本文着重分析和概......
挖掘教学数据是教育研究的重要手段。为探求课堂教学数据与教学效果的关系,本文收集了课堂产生的文本数据和量化数据,并从中提取......
继STEM教育之后,"创客"又是一个新出现的高频词,一线教育工作者关心创客对STEM教育可能产生的长远影响.本文基于Amazon.com网站的......
传统加密技术在文本数据加密中得到了广泛的应用。但由于二维数字图像的特殊性,如信息量非常大、相邻像素间具有很强的相关性、不......
九十年代初期,基于内容的多媒体检索一直是计算机领域的研究热点,那时的数据量、数据种类在量级上无法与今天相比,如今的多媒体数据当......
数据库服务外包是近几年兴起的一种新的数据库应用模式。外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部......
随着互联网和信息技术的迅速发展,文本数据规模指数爆炸式增长,网络已经成为一个丰富的数据宝矿。可是大量的数据不等于大量有价值的......
近年来,由于社交网络,即时通讯工具的普及,大量的文本数据涌入我们的生活。如何利用文本挖掘技术,从海量“堆积如山”的文本数据中更快......